前言:接來下三天會開始學習資料結構,如果內容有哪些錯誤的地方,請多多包涵~
正文開始-->
首先要瞭解什麼是資料結構。簡言之是電腦儲存資料並有效率使用資料的方式,指將資料組合後儲存的長相與形式,由資料型態組成。
R語言的資料結構主要分為三大項:
【向量VECTOR】
向量分為四個部分說明,分別為向量的定義、向量型態、產生連續向量及向量的運算。
向量定義
向量的組成為型態一致的一維資料。一為資料是指只有一個變數的數據。最常用到的就是利用c()
函數來定義向量。
使用範例:
產生連續向量
使用範例:
:
」符號:如1~15,可以使用「:」符號來串連首字與最後一字。seq()
函數向量的運算
【因子FACTOR】
因子是由向量轉換而成,多用於表示類別數據(如性別、年級、地區、政黨、身分別等等)。
由於因子是在向量上面多加了特性(attribute),因此屬於向量的一種,變成有順序的向量。使用方法為factor(資料向量,levels=類別次序)
,levels參數可設定各類別的次序。
完整程式碼:
region <- factor(c("新北市","台北市","桃園市","台中市","高雄市"))##設定因子
region##查詢原始資料
class(region)##查詢變數類型
levels(region)##查詢因子種類
使用範例:
參考: